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《MongoDB 入 门 指南 》 是 一 个 快速 入 门 MongoDB 的 教程 ， 它 以 MongoDB 的 3.0 版 本 进行 说 明 。 本 教程 安装 的 是 MongoDB 
Windows 64 位 版 本 ， 目 的 只 是 为 了 让 读者 快速 的 入 门 MongoDB， 快 速 理解 和 操作 MongoDB。 在 开发 或 生产 中 强烈 要 求 使 用 
Linux 版 本 。 

本 教程 是 基础 入 门 级 别 的 ， 只 包含 MongoDB 非 常 基础 的 CURD 操 作 和 基本 概念 ， 适 合 第 一 次 接触 MongoDB 的 人 员 阅 读 。 
本 教程 不 涉及 MongoDB 复 制 集 ， 分 片 集群 ， 分 布 式 文件 存储 ， 监 控 与 管理 等 内 容 。 以 上 知识 请 参考 MongoDB 官 方 手册 。 


开始 阅读 
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MongoDB f 7T 


MongoDB 是 一 个 开源 的 文档 类 型 数据 库 ， 它 具有 高 性 能 ， 高 可 用 ， 可 自动 收缩 的 特性 。MongoDB 能 够 避免 传统 的 ORM 映 射 
从 而 有 助 于 开发 。 


文档 


在 MongoDB 中 ， 一 行 纪 录 就 是 一 个 文档 ， 它 是 一 个 由 键 值 对 构成 的 数据 结构 ，MongoDB 文 档 与 JSON 对 象 类 似 。 键 的 值 可 以 
包含 其 他 的 文档 ， 数 组 ， 文 档 数 组 。 


"_id" : ObjectId("54c955492b7c8eb21818bd09"), 
“address t i E 
"street" : "2 Avenue", 
"Zipcode" : "10075", 
"building" : "1480", 
"coord" : [ -73.9557413, 40.7720266 ], 
}, 
"borough" : "Manhattan", 
"Cuisine" : "Italian", 
"grades" : [ 
{ 
"date" : ISODate("2014-10-01T00:00:00Z"), 
"grade" : "A", 
WS COGC were lol 
}, 
{ 
"date" : ISODate("2014-01-16T00:00:00Z"), 
"grade" : "B", 
SCO GCs ata: 
J 
], 
"name" : "Vella", 
"restaurant_id" : "41704620" 
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MongoDB 在 集合 中 存储 文档 。 集 合 类 似 于 关系 数据 库 中 的 表 。 然 而 ， 和 与 表 不 同 的 是 集合 不 要 求 它 里 面 的 文档 具有 相同 的 结 
构 。 


在 MongoDB 中 ， 存 储 在 集合 中 的 文档 必然 有 一 个 唯一 的 _id 字 段 作为 主键 。 


MongoDB 和 人 门 指南 


安装 MongoDB 


MongoDB 能 够 运行 在 多 种 平台 ， 并 支持 32 位 和 64 的 构架 。 


由 于 本 教程 是 在 Windows 上 开展 ， 所 以 只 讲 Windows 上 的 安装 。 其 他 平台 参考 MongoDB 官 方 手册 。 


在 Windows 上 安装 MongoDB 


MongoDB2.2 版 本 之 前 不 支持 Windows XP， 本 教程 使 用 的 版 本 是 最 新 的 3.0 的 版 本 。 为 了 方便 操作 和 理解 ， 所 以 选择 在 
Windows 讲 解 ， 生 产 环 境 请 使 用 Linux 版 本 。 


MongoDB 支 持 32 位 和 64 的 CPU 构 架 。32 位 版 本 只 是 为 了 适应 老 的 操作 系统 ， 用 于 开发 学 习 ， 它 有 很 多 局 限 性 ， 仅 支持 数据 
库 少 于 2G 的 系统 。64 位 版 本 还 有 一 个 Legacy 版 本 ， 它 不 包括 最 近 的 性 能 优化 ， 不 建议 使 用 。 


在 这 里 我 们 直接 下 载 这 个 64 位 版 本 (MongoDB for Windows 64-bit) 。 安 装 过 程 非常 简单 ， 跟 安装 其 他 软件 一 样 ， 一 直下 一 
步 就 行 了 。 比 如 我 的 机 器 上 安装 到 了 c:\mongodb ， 在 安装 目录 下 面 有 一 个 bin 目录 。 这 个 目录 包含 了 MongoDB 所 有 的 命令 和 
工具 集合 ， 把 它 配 置 到 环境 变量 PATH 中 。 如 果 你 选择 其 他 目录 安装 ， 请 确保 路 径 上 没有 空格 ， 不 然 到 时 候 会 有 很 多 坑 。 


设置 MongoDB 环 境 

MongoDB 需 要 一 个 目录 来 保存 数据 ， 默 认 的 数据 目录 是 \data\db 。 在 我 的 机 器 上 使 用 下 面 的 目录 作为 数据 目录 。 
C:\data\mongo 

你 可 以 在 启动 MongoDB 的 时 候 为 它 指定 一 个 数据 目录 。 例 如 我 们 用 如 下 命令 启动 MongoDB: 
C:\mongodb\bin\mongod.exe --dbpath C:\data\mongo 


数据 目录 不 应 该 包含 空格 ， 否 则 要 用 mongod.exe --dbpath "C:datamongo"。 这 些 启动 参数 都 是 可 以 放 到 配置 文件 当中 的 ， 
启动 的 时 候 指定 配置 文件 。 由 于 配置 文件 的 参数 比较 多 ， 我 们 这 里 暂时 不 需要 理解 那么 多 ， 先 不 使 用 。 


mongod.exe --config /etc/mongod.conf 


运行 MongoDB 
启动 MongoDB， 使 用 mongod.exe 命令 ， 例 如 : 


C:\mongodb\bin\mongod.exe --dbpath C:\data\mongo 


以 上 命令 用 来 启动 MongoDB 服 务 主 进程 ， 并 指定 数据 目录 。 执 行 完 此 命令 后 ， 在 控制 台 会 打印 一 系列 的 启动 信息 ， 包 括 
MongoDB 的 版 本 ， 是 否 根 据 journal 日 志 执 行 recovery， 进 程 的 信号 ， 操 作 系统 的 信息 等 范 。 最 后 一 行 会 提示 你 启动 成 功 ， 监 
听 了 27017 端 口 ， 等 待 连接 消息 。 


连接 MongoDB 
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使 用 mongo.exe 命令 连接 。 打 开 另 一 个 命令 行 窗口 ， 输 入 如 下 命令 : 


C:\mongodb\bin\mongo.exe 


执行 些 命 售后， 就 能 连接 上 MongoDB 服 务 。 由 于 没有 配置 任何 其 他 端口 ， 也 没有 配置 权限 认证 ， 所 以 一 切 都 是 默认 的 本 地 连 
接 ， 相 当 简单 。 连 接 成 功 后 ， 榴 行 help 命 售 ， 看 看 有 什么 内 容 吧 。 


对 
Ne 
[ep] 
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导入 数据 


本 教程 使 用 test 数 据 库 和 restaurants 集 合 为 例 进行 讲解 。 下 面 是 restaurants 的 一 个 文档 结构 示例 : 


{ 
"address": { 
"building": "1007", 
"coord": [ -73.856077, 40.848447 ], 
"street": "Morris Park Ave", 
"Zipcode": "10462" 
}, 
"borough": "Bronx", 
"cuisine": "Bakery", 
"grades": [ 
{ "date": { "$date": 1393804800000 }, "grade": "A", "score": 2 }, 
{ "date": { "$date": 1378857600000 }, "grade": "A", "score": 6 }, 
{ "date": { "$date": 1358985600000 }, "grade": "A", "score": 10 }, 
{ "date": { "$date": 1322006400000 }, "grade": "A", "score": 9 }, 
{ "date": { "$date": 1299715200000 }, "grade": "B", "score": 14 } 
l; 
"name": "Morris Park Bake Shop" 
"restaurant_id": "30075445" 
} 


导入 例子 数据 
在 进行 操作 之 前 ， 我 们 需要 例子 数据 ， 在 这 里 下 载 数 据 文件 dataset.json。 
导入 数据 到 集合 


在 命令 行 中 执行 mongoimport 命令 将 上 面 下 载 的 数据 文件 中 的 数据 导入 到 test 数据 库 的 restaurants 集合 中 。 如 果 此 集合 已 经 
存在 ， 下 面 的 操作 会 先 删除 。 


mongoimport --db test --collection restaurants --drop --file C:\data\dataset.json 


mongoimport 命令 连接 到 本 机 运行 的 mongod 实例 ， 如 果 要 把 数据 导 到 不 同 主机 ， 不 同 端口 的 实例 ， 可 以 指定 主机 和 端口 ， 使 
用 参数 --host 和 --port o 


数据 导入 后 ， 你 可 以 用 mongo 命令 连接 到 实例 ， 使 用 show dbs ， use test ， show collections 和 db.restaurants.find() OD 
查看 导入 的 数据 。 
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Mongo 命 令 行 是 一 个 跟 MongodDB 服 务 交 互 的 JavaScript 接 口 工 具 ， 它 是 MongoDB 封 装 的 一 个 组 件 。 你 可 以 使 用 这 个 命令 行 


工具 查询 ， 更 新 数据 ， 执 行 一 些 管理 操作 。 





安装 并 启动 MongoDB 后 ， 就 可 以 连接 mongo 命令 行 到 MongoDB 实 例 了 。 先 确认 MongoDB 实 例 已 


Zh) mongo 命令 行 连接 。 


打开 一 个 命令 行 窗口 ， 执 行 如 下 命令 即 可 : 


mongo 


请 确认 你 已 经 配置 了 环境 变量 ， 在 Windows 上 你 也 可 以 加 上 后 组 .exe: 


mongo.exe 


如 果 没 有 配置 环境 变量 ， 你 要 指定 命令 的 全 路 径 。 


C:\mongodb\bin\mongo.exe 


当 运 行 mongo 命 仿 ， 不 指定 任何 参数 的 时 候 ， 它 默认 是 连接 到 本 机 localhost 的 27017 端 口 。 详 细 的 参数 参考 MongoDB Shell 


Mongo 命 令 行 Help 命 兮 
在 mongo 命 令 行 中 输出 help 将 会 列 出 所 有 可 用 的 命令 以 及 描述 。 


> help 


mongo 命 邻 行 还 提供 了 跟 Linux 一 样 的 自动 完成 和 提示 功能 。 并 且 可 以 使 用 上 下 箭头 翻动 历史 命令。 
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使 用 mongo 命 邻 行 插入 数据 
概述 


在 MongoDB 中 ， 你 可 以 使 用 insert() 方法 插入 一 个 文档 到 MongoDB 集 合 中 ， 如 果 此 集合 不 存在 ，MongoDB 会 自动 为 你 创 
建 。 


插入 文档 


先 用 mongo 命 令 行 连接 到 一 个 MongoDB 实 例 ， 转 到 test 数 据 库 。 


use test 


插入 一 个 文档 到 restaurants 集 中 ， 如 果 restaurants 集 合 不 存在 ， 这 个 操作 会 先 创建 一 个 restaurants 集 合 。 


db.restaurants.insert( 


{ 
"address" : { 
"street" : "2 Avenue", 
"Zipcode" : "10075", 
"building" : "1480", 
"coord" : [ -73.9557413, 40.7720266 ], 
3, 
"borough" : "Manhattan", 
"cuisine" : "Italian", 
"grades" : [ 
{ 
"date" : ISODate("2014-10-01T00:00:00Z"), 
“Grade e GAN 
Wscone ll 
3, 
{ 
"date" : ISODate("2014-01-16T00:00:00Z"), 
toradet sau 
"score = 17 
J 
Ilg 
"name" : "Vella", 
"restaurant_id" : "41704620" 
} 


可 以 看 到 ， 命 令 行 的 执行 ， 其 实 就 是 javascript 函 数 的 调用 。 画 数 调用 后 返回 一 个 writeResult 对 象 ， 它 包含 操作 的 返回 状态 
信息 。 


如 果 插 入 的 文档 不 包含 _id 字段 ，mongo 命 合 行 会 自动 加 上 这 个 字段 到 文档 中 ， 并 且 这 个 字段 的 值 是 根据 Objectld 生 成 。 


插入 数据 
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使 用 mongo 命 令 行 查 询 数据 
概述 


使 用 find() 方法 在 MongoDB 集 合 中 查询 数据 。MongoDB 所 有 的 查询 范围 都 是 单个 集合 的 。 也 就 是 说 MongoDB 不 能 跨 集合 
查询 数据 。 


查询 可 以 返回 集合 中 的 所 有 文档 ， 或 者 仅仅 返回 指定 过 滤 条 件 的 文档 。 你 可 以 指定 一 个 过 滤 条 件 或 才 一 个 判断 条 件 作为 参数 


传递 给 find() 方法 。 


find() 方法 在 一 个 游标 中 返回 所 有 的 结果 集 ， 通 过 游标 的 迭代 可 以 输出 所 有 文档 。 

查询 集合 中 的 所 有 文档 

查询 集合 中 的 所 有 文档 ， 直 接 调用 集合 的 find() 方法 ， 不 需要 指定 条 件 。 如 下 命令 查询 restaurants 中 的 所 有 文档 。 
db. restaurants. find( ) 

返回 的 结果 集 包含 restaurants 所 有 的 文档 。 

指定 "等 于 "条 件 

查询 条 件 如 果 是 某 个 字段 上 的 “等 于 "匹配 的 话 ， 具 有 如 下 格式 : 
{ <fieldi>: <valuel>，<field2>: <value2>, ... } 


如 果 是 文档 中 的 顶级 字段 ， 并 不 是 内 嵌 的 ， 也 不 是 数组 的 话 ， 你 可 以 使 用 引号 括 住 字段 名 ， 或 者 不 使 用 引号 。 


如 果 就 文 内 府 字 段 ， 或 者 是 数组 ， 使 用 “." 号 访问 字段 。 而 且 必 要 使 用 相 号 括 住 整个 字段 名 。 
SFL ` 

根据 顶级 字段 查询 

下 面 的 命令 查询 所 有 borough 字段 值 为 "Manhattan" 的 文档 。 


db.restaurants.find( { "borough": "Manhattan" } ) 


查询 的 结果 集中 仅 包 含 匹配 的 文档 。 
根据 数组 中 的 字段 查询 


在 restaurants 集 合 中 ，grades 数 组 包含 了 内 艇 文档 作为 它 的 元 素 。 使 用 '…" 号 可 以 在 内 禾 文 档 中 的 某 个 字段 上 指定 一 个 条 件 。 
同样 ， 需 要 用 引号 括 住 有 点 号 的 引用 。 如 下 命 合 查 询 grades 包 括 一 个 内 婴 文 档 ， 它 的 grade 字 段 的 值 为 'B' 的 所 有 文档 。 


db.restaurants.find({"grades.grade": "B"}) 
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指定 操作 条 件 查询 


MongoDB 提 供 了 一 些 操作 用 来 指定 查询 条 件 ， 比 如 比较 操作 。 一 些 操作 是 除 此 之 外 的 ， 比 如 sor 和 sand 条 件 操作 。 使 用 操 
作 的 查询 条 件 的 格式 如 下 : 


{ <fieldi>: { <operator1>: <value1> } } 


大 于 操作 ($gt) 
查询 所 有 grades 数 组 的 内 嵌 文 档 中 score 字 段 的 值 大 于 30 的 文档 。 


db.restaurants.find( { "grades.score": { $gt: 30 } } ) 


小 于 操作 ($lt) 


db.restaurants.find( { "grades.score": { $lt: 10 } } ) 


逻辑 AND 
你 可 以 使 用 逻辑 AND 用 于 查询 条 件 之 间 ， 使 用 有 逗号 隔 开 。 
db.restaurants.find( { "cuisine": "Italian", "address.zipcode": "10075" } ) 
逻辑 OR 
你 可 以 为 多 个 查询 条 件 中 使 用 逻辑 OR， 使 用 $or 查 询 操 作 。 


db.restaurants.find( 
Sor ht Cusi nes a calana address Zipcode a 11007515 el 
) 


当然 ，$and 也 可 以 使 用 上 面 的 语法 。 


排序 查询 结 


指定 查询 结果 排序 方式 的 就 是 在 查询 后 追加 一 个 sort() 方法 调用 。 传 递 给 此 方法 一 个 文档 ， 包 含 指定 排序 字段 和 排序 类 型 。 
1 表示 长 充 ， -1 表示 降序 。 


db.restaurants.find().sort( { "borough": 1, "address.zipcode": 1 } ) 
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如 上 命令 ， 先 按 borough 字 段 升序 排列 ， 再 按 address.zipcode 升 序 排 。 





查询 数据 
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使 用 mongo 命 令 行 更 新 数据 
概述 


使 用 update() 方法 更 新 文档 。 这 个 方法 接收 以 下 参数 : 


e 一 个 方 档 匹配 的 过 滤器 ， 用 于 过 滤 要 更 新 的 文档 
o 一 个 用 来 执行 修改 操作 的 更 新 文档 
e 一 个 可 选 的 参数 


指定 过 滤器 和 指定 查询 的 时 候 是 一 样 的。 update() 方法 默认 只 更 新 单个 文档 ， 使 用 multi 可 选 参数 指定 更 新 所 有 匹配 的 文 
档 。 


不 能 更 新 文档 的 id 字段 。 
已 cc EL 
更 新 指 EFE 
要 改变 某 个 字段 的 值 ，MongoDB 提 供 了 更 新 操作 ， 比 如 sset 用 来 修改 值 。 如 果 字 段 不 存在 ， sset 会 创建 这 个 字段 。 


更 新 顶级 字段 


下 面 的 操作 更 新 name 字段 值 为 "Juni" 的 第 一 个 文档 ， 使 用 $set 操作 更 新 cuisine 字 段 ， 使 用 $currentpate 操作 更 新 
lastModified 字 段 。 


db.restaurants.update( 


fun amelie sews UMass, 
{ 
$set: { "Cuisine": "American (New)" }, 
$currentDate: { "lastModified": true } 
} 


更 新 操作 会 返回 一 个 writeResult 对 象 ， 它 包含 更 新 操作 返回 的 一 些 状 态 信息 。 
RATA BRIS AS FER 
ERATE, BS, MRR : 


db.restaurants.update( 

{ "restaurant_id" : "41156888" }, 

{ $set: { "address.street": "East 31st Street" } } 
) 


更 新 多 个 文档 


默认 地 ， update) 方法 只 更 新 一 个 文档 。 如 果 要 更 新 多 个 文档 ， 需 要 指定 multi 可 选 参数 。 


db.restaurants.update( 











更 新 数据 
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{ "address.zipcode": "10016", cuisine: "Other" }, 


{ 
$set: { cuisine: "Category To Be Determined" }, 
$currentDate: { "lastModified": true } 


}, 
{ multi: true} 


) 


蔡 换 文档 


要 替换 一 个 文档 ， 只 需要 把 一 个 新 的 文档 传递 给 update() 的 第 二 个 参数 ， 并 且 不 需要 包含 _id 字段。 
保证 跟 原文 档 是 同一 个 值 。 用 于 替换 的 文档 可 以 跟 原 文档 具有 完全 不 同 的 字段。 


db.restaurants.update( 


{ "restaurant_id" : "41704620" }, 
{ 
"name" : "Vella 2", 
"address" : { 
"coord" : [ -73.9557413, 40.7720266 ], 
"building" + "1486", 
"street" : "2 Avenue", 
"Zipcode" : "10075" 
} 
J 
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使 用 mongo 命 令 行 删 除数 据 
概述 


使 用 remove() 方法 从 集合 中 删除 文档 。 这 个 方法 需要 一 个 条 件 文 档 用 来 决定 哪些 文档 将 被 删除 。 


删除 匹配 的 所 有 文档 
下 面 的 操作 将 删除 指定 条 件 匹配 的 所 有 文件 : 
db.restaurants.remove( { "borough": "Manhattan" } ) 
删除 操作 返回 一 个 writeResult 对 象 ， 它 包含 了 操作 的 状态 信息 。 nRemoved 字段 值 表示 被 删除 的 文档 数量 。 
使 用 justOne 可 选 参数 
默认 地 ， remove() 方法 将 删除 匹配 指定 条 件 的 所 有 文档 。 使 用 justOne 可 选 参数 可 以 限制 删除 操作 只 删除 一 条 。 
db.restaurants.remove( { "borough": "Queens" }, { justOne: true } ) 
操作 成 功 将 返回 如 下 的 writeResult 对 象 。 
WriteResult({ "nRemoved" : 1 }) 


nRemoved 字段 值 表示 删除 的 文档 数量 。 


删除 所 有 文档 


删除 一 个 集合 中 的 所 有 文档 ， 传 递 一 个 空 的 条 件 文档 即 可 。 


db.restaurants.remove( { } ) 


删除 一 个 集合 


删除 所 有 的 操作 久久 是 删除 集合 中 的 全 部 文档 。 集 合 本 身 和 集合 的 索引 并 不 会 被 删除 。 直 接 删 除 集合 包括 索引 ， 也 许 比 删除 


一 个 集合 中 的 所 有 文档 更 高 效 。 需 要 的 时 候 重 新 创建 集合 并 构建 索引 。 使 用 drop() 方法 删除 一 个 集合 ， 包 括 所 有 索引 。 


db.restaurants.drop() 


删除 集合 如 果 成 功 ， 此 操作 将 返回 true。 如 果 被 删除 的 集合 不 存在 ， 将 返回 false。 


在 MongoDB 中 ,，" 写 "操作 是 文档 级 别 的 原子 操作 。 如 果 一 个 删除 操作 要 删除 集合 中 的 多 个 文档 ， 这 个 操作 会 和 其 他 写 操 作 交 





删除 数据 
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车。 具体 请 参考 MongoDB 手 册 中 Atomicity。 


出 除数 据 
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使 用 mongo 命 令 行 进行 数据 聚合 


MongoDB 可 以 执行 数据 聚合 ， 比 如 按 指定 Key 分 组 ， 计 算 总 数 ， 求 不 同 分 组 的 值 。 


使 用 aggregate() 方法 执行 一 个 基于 步骤 的 聚合 操作 (类 似 于 Linux 管 道 ) 。 aggregate() 接收 一 个 步骤 数组 成 为 它 的 参数 ， 每 
个 步骤 描述 对 数据 处 理 的 操作 。 


db.collection.aggregate( [ <stage1>, <stage2>, ... ] ) 


按 字 段 分 组 并 计算 总 数 


使 用 $group 管 理 操作 符 进 行 分 组 操作 。 在 $group 操 作 符 中 ， 使 用 _id 来 说 明 分 组 的 key。$gropu 管 理 操作 使 用 $+ 字段 名 的 方 
式 来 访问 分 组 Key 的 。 可 以 在 每 个 分 组 管理 操作 中 进行 分 组 计算 。 下 面 的 例子 把 restaurants 集 合 按 borough 字 段 分 组 ， 并 使 用 
$sum 操 作 符 计算 每 个 分 组 的 文档 数 。 





db.restaurants.aggregate( 


[ 
(R oroup e duo SHOROUGNI ee COUNT ebS Um 


] 

) 

结果 集 包 含 以 下 文档 : 
J Ean Island? “count + 969s 
{ "id" : "Brooklyn", "count" : 6086 } 
‘(fend ee ManhaltcanneasnGOUNt .T0200 
{ void “Queens. “Count.” © 5656.) 
sid Bronx count) 23382) 
OSI Missing COUnNt hat} 


_id 字段 包含 了 不 同 的 borough 值 ， 它 也 是 分 组 参照 的 Key 值 。 


过 滤 并 分 组 文档 


使 用 smatch 管道 操作 符 过 滤 文 档 。 smatch 使 用 的 是 MongoDB 查 询 语法 。 下 面 的 管道 使 用 $macth 查询 borough 字 段 值 
为 "Queens" 并 且 cuisine 字 段 值 为 "Brazilian" 的 所 有 文档 。 然 后 $group 分 组 管理 操作 符 把 匹配 的 所 有 文档 按 address.zipcode 字 
段 每 组 ， 并 且 使 用 ssum 计算 器 计算 总 数 。 


db.restaurants.aggregate( 


[ 


{ $match: { "borough": "Queens", "Cuisine": "Brazilian" } }, 
{ $group: { "_id": "$address.zipcode" , "count": { $sum: 1 } } } 
] 
) 
结果 集 包含 的 文档 如 下 : 
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_id 字段 包含 不 同 的 zipcode 的 值 。 它 是 分 组 的 Key。 
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Journaling 日 志 机 制 


运行 MongoDB 如 果 开 让 了 journaling 日 志 功能 ，MongoDB 先 在 内 存 保存 写 操 作 ， 并 记录 journaling 日 志 到 磁盘 ， 然 后 示 会 把 数 
据 改变 刷 入 到 磁盘 上 的 数据 文件 。 为 了 保证 journal 日 志文 件 的 一 致 性 ， 写 日 志 是 一 个 原子 操作 。 本 文 特 讨论 MongoDB 中 
journaling 日 志 的 实现 机 制 。 


Journal 日 志文 件 


如 果 开 启 了 journal 日 志 功 能 ，MongoDB 会 在 数据 目录 下 创建 一 个 journal 文件 夹 ， 用 来 存放 预 写 重 放 日 志 。 同 时 这 个 目录 也 
会 有 一 个 last-sequence-number 文件 。 如 果 MongoDB 安 全 关闭 的 话 ， 会 自动 删除 此 目录 下 的 所 有 文件 ， 如 果 是 崩溃 导致 的 关 
闭 ， 不 会 删除 日 志文 件 。 在 MongoDB 进 程 重启 的 过 程 中 ，journal 日 志文 件 用 于 自动 修复 数据 到 一 个 一 致 性 的 状态 。 





journal 日 志文 件 是 一 种 往 文 件 尾 不 停 追加 内 容 的 文件 ， 它 命名 以 j._ 开头 ， 后 面 接 一 个 数字 (从 0 开始 ) 作为 序列 号 。 如 果 文 
件 超 过 1G 大 小 ，MongoDB 会 新 建 一 个 journal 文件 j. .1 。 只 要 MongoDB 把 特定 日 志 中 的 所 有 写 操 作 刷 入 到 磁盘 数据 文件 ， 

将 会 删除 此 日 志文 件 。 因 为 数据 已 经 持久 化 ， 不 再 需要 用 它 来 重 放 恢 复数 据 了 。journal 日 志文 件 一 般 情 况 下 只 会 生成 两 三 
个 ， 除 非 你 每 秒 有 大 量 的 写 操 作 发 生 。 





如 果 你 需要 的 话 ， 你 可 以 使 用 storage.smallFiles 参数 来 配置 journal 日 志文 件 的 大 小 。 比 如 配置 为 128M 。 


Journaling 机 制 的 存储 视 


Journaling 功 能 用 到 了 MongoDB 存 储 层 数据 集 内 部 的 两 个 视图 。 


shared 视图 保存 数据 修改 操作 ， 用 于 刷 入 到 磁 总 数据 文件 。 shared 视图 是 MongoDB 中 唯一 访问 磁盘 数据 文件 的 视 
图 。 mongod 进程 请 求 操 作 系 统 把 磁盘 数据 文件 映射 到 虚拟 内 存 的 shared 视图 。 操 作 系 统 只 是 映射 数据 与 内 存 关系 ， 并 不 马 
上 加 载 数据 到 内 存 。 当 查询 需要 的 时 候 ， 才 会 加 载 数据 到 内 存 ， 即 按 需 加 载 。 








private 视图 存储 用 于 查询 操作 的 数据 。 同 时 private 视图 也 是 MongoDB 执 行 守 操作 的 第 一 个 地 方 。 一 旦 journal 日 志 提 交 完 
成 ，MongoDB 会 复制 private 视图 中 的 改变 到 shared 视图 ， 再 通过 shared 视图 将 数据 刷 入 到 磁盘 数据 文件 。 





journal 视图 是 一 个 用 来 保证 新 的 写 操作 的 磁盘 视图 。 当 MongoDB 在 private 视图 执行 完 写 操作 后 ， 在 数据 刷 入 磁盘 之 前 ， 
会 先 记 录 journal 日 志 。 journal 日 志保 证 了 持久 性 。 如 果 mongod 实例 在 数据 刷 人 磁盘 之 前 崩溃 ， 重 启 过 程 中 journal 日 志 会 
重 放 并 写 入 shared 视图 ， 最 终 刷 入 磁盘 持久 化 。 








Journaling 如 何 纪录 写 操 作 


MongoDB 采 用 group commits 方式 将 写 操 作 批 量 复制 到 journal 日 志文 件 中 。 group commits 提交 方式 能 够 最 小 化 journal 日 志 
机 制 对 性 能 的 影响 。 因 此 group commits 方式 在 提交 过 程 中 必须 阻塞 所 有 写 入 。 commitIntervalMs 参数 可 以 用 于 配置 日 志 提交 
的 频率 ， 默 认 是 100ms。 


Journaling 存 储 以 下 原始 操作 : 


© 文档 插入 或 更 新 

。 索引 修改 

o 命名 空间 文件 元 数据 的 修改 

o 创建 和 者 删除 数据 库 或 关联 的 数据 文件 


当 发 生 罕 操作 ， MongoDB 首 先 写 入 数据 到 内 存 中 的 private 视图 ， 然 后 批量 复制 写 操 作 到 journal 日 志文 件 。 
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个 journal 日 志 实 体 来 用 描述 写 操 作 改 变数 据 文 件 的 哪些 字 


MongoDB 接 下 来 执行 journal 的 写 操 作 到 shared 视图 。 此 时 ， shared 视图 与 磁盘 数据 文件 不 一 样 。 





默认 每 60s 钟 ，MongoDB 请 求 操作 系统 将 shared 视图 刷 入 到 磁盘 。 使 数据 文件 更 新 到 最 新 的 写 和 状态。 如 果 系 统 内 存 资源 不 
足 的 时 候 ， 操 作 系统 会 选择 以 更 高 的 频率 刷 和 人 shared 视图 到 磁盘 。 


MongoDB 刷 入 数据 文件 完成 后 ， 会 通知 journal ARBARA. —H journal 日 志文 件 只 包含 全 部 刷 入 的 写 操 作 ， 不 再 用 于 
恢复 ，MongoDB 会 将 它 删 除 或 者 作为 一 个 新 的 日 志文 件 再 次 使 用 。 


作为 journaling 机 制 的 一 部 分 ，MongoDB 会 例 行 性 请 求 操 作 系统 重新 将 shared 视图 映射 到 private 视图 ， 为 了 节省 物理 内 
存 。 一 旦 发 生 重 了 映射， 操作 系统 能 够 识别 到 可 以 在 private 视图 和 shared 视图 共享 的 内 存 页 映射 。 


小 结 


Journaling 是 MongoDB 中 非常 重要 的 一 项 功能 ， 类 似 于 关系 数据 库 中 的 事务 日 志 。Journaling 能 够 使 MongoDB 数 据 库 由 于 意 
外 故障 后 快速 恢复 。MongoDB2.0 版 本 后 默认 开启 了 Journaling 日 志 功 能 ， mongod 实例 每 次 启动 时 都 会 检查 journal 日 志文 件 
看 是 否 需 要 恢复 。 由 于 提交 journal 日 志 会 产生 写 入 阻塞 ， 所 以 它 对 写 入 的 操作 有 性 能 影响， 但 对 于 读 没有 影响 。 在 生产 环 
境 中 开启 Journaling 是 很 有 必要 的 。 
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MongoDB 原 子 性 和 事务 


在 MongoDB 中 ， 写 操作 的 原子 性 是 在 document 级 别 上 的 ， 即 使 修改 的 是 文档 中 的 内 嵌 部 分 ， 写 锁 的 级 别 也 是 document 上 。 


当 一 个 写 操 作 要 修改 多 个 文档 ， 每 个 文档 的 修改 是 原子 性 的 。 整 个 的 写 操作 并 不 是 原子 性 的 ， 它 可 能 和 其 他 写 操 作 产 生 交 
织 。 然 而 你 可 以 使 用 $isolated 隔离 操作 符 来 限制 写 操 作 ， 让 它 不 与 其 他 写 操 作 交织 。 不 隔离 性 能 更 高 ， 但 是 会 产生 数据 的 
不 确定 性 ， 隔 离 写 操作 ， 事 务 性 更 好 。MongoDB 把 这 个 级 别 完全 由 用 户 控制 。 


fas SRE 


MongoDB 使 用 sisolated 操作 符 来 隔离 写 操 作 。 如 果 一 个 写 操作 要 更 新 多 个 文档 ， 它 能 防止 其 他 进程 与 本 次 写 操 作 交 错 。 直 
到 这 个 写 操 作 完 成 ， 其 他 进程 才能 写 。 


但 是 ， $isolated 算 不 上 一 个 事务 ， 如 果 在 写 的 过 程 中 发 生 错 误 ，MongoDB 并 不 会 回 滚 已 经 写 的 数据 。 $isolated 也 不 能 在 
分 片 集 群 上 工作 。 


特性 : 


e 隔离 不 支持 分 片 集群 
e 不 支持 “all-or-nothing" 特 性 
e MongoDB2.2 版 本 后 $isolated 被 替换 成 $atomic 


类 事务 语法 


MongoDB 并 不 支持 关系 型 数据 库 中 的 那 种 事务 特性 ， 为 了 性 能 着 想 ， 它 把 这 个 特性 交 给 程序 员 去 实现 。 这 就 是 MongoDB 官 
方 所 讲 的 Two Phase Commits 两 阶段 提交 。 这 个 技术 虽然 在 一 定 程度 上 能 保证 数据 最 终 的 一 致 性 ， 但 是 应 用 程序 还 是 可 能 会 
读 到 提交 或 者 回 滚 过 程 中 的 中 间 数 据 。 对 于 这 个 技术 如 果 有 兴趣 可 以 读 一 读 原文 。 


并 发 控制 
并 发 控制 允许 多 个 应 用 层 程序 同时 访问 数据 库 ， 而 不 引起 数据 不 一 致 或 冲突 。 


MongoDB 中 提 到 两 种 技术 来 解决 这 个 问题 。 第 一 种 是 唯一 索引 ， 第 二 种 是 叫 Update if current o 


用 唯一 索引 来 防止 多 个 进程 重复 插入 或 者 更 新 导致 的 重复 的 值 。 update if current 意思 是 说 在 更 新 数据 的 时 候 ， 在 更 新 条 件 
里 给 定 一 个 期 望 的 值 (这 个 值 是 先 查 询 出 来 的 ) ， 用 来 防止 在 更 新 之 前 其 他 进程 已 经 将 此 值 更 新 。 看 一 个 例子 : 


var myDocument = db.products.findOne( { sku: "abc123" } ); 


if ( myDocument ) { 
var oldQuantity = myDocument.quantity; 
var oldReordered = myDocument.reordered; 


var results = db.products.update( 

{ 
_id: myDocument._id, 
quantity: oldQuantity, 
reordered: oldReordered 

}, 

{ 
Sine: { quantity: 50 }, 
$set: { reordered: true } 
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if ( results.haswriteError() ) { 


print( "unexpected error updating document: " + tojson(results) ); 
} 
else if ( results.nMatched === 0 ) { 
print( "No matching document for " + 
"{ _id: "+ myDocument._id.toString() + 
",) quantity: " + oldQuantity + 
"| reordered: " + oldReordered 
zee 
); 
} 


EAN, tEfindAndModifty) HAR: 


db. people. findAndModify( { 
query: { name: "Andy" }, 
Sorto De F 
update: { $inc: { score: 1 } }, 
upsert: true 


}) 


如 果 有 多 个 进程 同时 调用 此 函数 ， 这 些 进程 都 完成 了 查询 阶段 ， 


程 可 能 都 会 执行 。 导 致 守 入 重复 的 文档 。 








原子 性 和 事务 


如 果 name 字段 上 没有 唯一 索引 ，upsert 阶 段 的 操作 ， 多 


个 进 
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